*Exportação de dados:
use https://doi.org/10.7910/DVN/7BIPMF, clear

*Utilização de log natural para variáveis de grande valor:
generate lV=ln(VEIC)
generate lRM=ln(RMe)
generate lPO=ln(PO)
generate lRel=ln(REL)
generate lCPF=ln(CPF)

*Análise de correlação entre variáveis apresentadas:
pwcorr lV lRM lPO lRel lCPF USD PGAS ICC ICEA IEC, star (0.05)

*Regressao considerando todas as variaveis
reg lV lRM lPO lRel lCPF USD PGAS ICC ICEA IEC

*Regressao com uso do stepwise considerando faixa de significância de 0.05 e corte em 0.10
stepwise, pr(0.10) pe(0.05) forward: reg lV lRM lPO lRel lCPF USD PGAS ICC ICEA IEC

*Regressao considerando resultado do stepwise
reg lV ICEA lPO lRM lCPF

*Teste de multicolinearidade
vif

**OBS: multicolinearidade apresentada.

*Proposta 1 para solução de multicolinearidade (exluir lRM)
reg lV ICEA lPO lCPF
vif

**OBS: apos ajuste, problemas de multicolinearidade resolvido

*Proposta 2 para solução de multicolinearidade (exluir lCPF)
reg lV ICEA lPO lRM
vif

**OBS: apos ajuste, problemas de multicolinearidade resolvido

***sera mantida variavel lRM e excluida lCPF visto que a primeira apresenta melhores resultados preditivos

*Refazer regressão com variáveis mantidas
reg lV ICEA lPO lRM

*Teste de outlier
predict cooksd, cooksd
scatter cooksd lV, mlabel(lV) 

*Regressao sem outlier
reg lV ICEA lPO lRM if lV !=12.15006 & 12.36771

**OBS: resultado irrelevante para o modelo, manter outlier
reg lV ICEA lPO lRM

*Apuracao de variaveis omitidas
ovtest

**OBS: sem indicios de variaveis omitidas

*Teste de heterocedasticidade
hettest
estat imtest, white

**OBS: nao ha problemas com heterocedasticidade

*Teste de normalidade dos residuos
predict residuals, residuals
sfrancia residuals

**OBS: residuos apresentam distribuicao normal

*Forma funcional do modelo
linktest

**OBS: forma linear adequada, mas com baixa significância de predição

